17/08, 2020

Que es la investigación reproducible?

  • Código, datos (Crudos) y texto entrelazados
  • en R: Rmarkdown (Rmd)

Metas del día de hoy

  1. Primer commit en github
  2. Un código en un chunk
  3. Un inline code
  4. Una tabla en el Rmarkdown
  5. Generar una primera exploración de datos con la base de datos

Github

Github

  • Como “Google Drive” o “Dropbox” para código
  • Control de cambios (Podemos volver a cualquier versión anterior)
  • En base a codigo (idealmente), pero hay GUIs
  • Cada proyecto es un repositorio

Crear primer repositorio

  • Crearse cuenta en github.com
  • Crear repositorio en github

Crear primer repositorio

Copiar la url

Volvamos a RStudio

  • Creamos un proyecto nuevo

Pegamos la URL

La nueva pestaña git

Los “¿tres?” pasos de un repositorio

  • Git add: Agregar a los archivos que vas a guardar
  • Git commit: Guardar en el repositorio local (Mi computador)
  • Git push: Guardar en el repositorio remoto (En la nube)
  • Otros como git merge, git pull, git clone, etc

Git Add

  • Sumar un archivo al repositorio
  • ¿Cuando no hacerlo?
    • Limite de un archivo de 100 Mb
    • Límite de un repositorio de un Gb

Git commit

  • Con esto dices quiero guardar mis cambios en mi disco duro
  • Se guarda en tu repositorio local (Tu computador)

Mensaje del commit

  • Debe ser relevante (ejemplo, no poner Version final ahora si)
  • Si te equivocas puedes restablecer a cualquier commit anterior (si sabes cual es)

A guardar el repositorio (git push)

  • Con esto subes tu commit a la nube (queda respaldado)

Clásico error

Configurar github

git config --global user.name "derek-corcoran-barrios"
git config --global user.email "derek-corcoran-barrios@gmail.com"

Si no resulta

  • Si estas en windows instala git
  • Si estas en mac
  • Si estas en linux
sudo apt-get update
sudo apt-get install git

Dudas?

Reproducibilidad en R

  1. Una carpeta
    • Datos crudos (csv, xls, html, json)
    • Codigo y texto (Rmd, Rpres, shiny)
    • Resultados (Manuscrito, Pagina Web, App)

Antes de empezar (importar datos)

  • Hasta ahora hemos usado data (sólo para bases incorporadas en R)
  • Dede hoy usaremos read_csv (Para csv, para otros archivos hay otras funciones)

Crear un nuevo Rmarkdown

Partes de un Rmd

Texto

link

# Titulo

## subtitulo

*cursiva*

**negrita**

[link](https://stackoverflow.com/users/3808018/derek-corcoran)

Chunks

knitr::include_graphics("Chunk.png")

  • echo = T o F muestro o no codigo
  • message = T o F muestra mensajes de paquetes
  • warning = T o F muestra advertencias
  • eval = T o F evaluar o no el código
  • cache = T o F guarda o no el resultado
  • Para más opciones ver este link

Inline code

Inline

  • Código entrelazado en el texto
  • Para actualizar medias, máximos, mínimos
  • Valores de p, diferencias estadísticas
  • Pueden ser vectores, no tablas.

Ejemplo

Pueden copiar el codigo de el siguiente link, copiarlo en un archivo rmd, apretar knit y debieran ver algo como esto:

Terremotos

Tablas

Tablas: Kable

  • kable parte de knitr, tabla igual a lo ingresado
  • KableExtra lo mejora

Armemos nuestras propias tablas!!!

Tabla

Ejercicio

  • Usando la base de datos iris crea un inline code que diga cuál es la media del largo del pétalo de la especie Iris virginica